بهبود عملکرد عاملها در جامعه مصنوعی با استفاده از یادگیری تقویتی

نویسندگان

  • آرش رحمان گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران[email protected]
  • امیر پویان خدابخشی گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران[email protected]
  • محسن روحانی گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران [email protected]
چکیده مقاله:

چکیده معمولاً در سیستم‌های چندعاملی، تعاملات بین عامل‌ها و تعاملات عامل‌ها با محیط، به صورت انتخاب و اجرای عمل‌هایی از بین مجموعه‌ای محدود از اَعمال مشخص توسط عامل‌ها حاصل می‌شود. بنابراین نوع و میزان پیچیدگی رفتارهای پیدایشی حاصل از این تعاملات نیز به نحوه اجرا و تعداد رفتارهای قابل اجرا توسط عامل‌ها وابسته است. در این پژوهش سعی شد با توسعه مدل کسب و انتقال تجربه و اضافه کردن قابلیت یادگیری به عامل‌ها، تاثیر یادگیری در بهبود رفتار عامل‌ها در انتخاب روش (راهبرد) های انتقال تجربه و در بهبود شاخص‌های رفاهی در جامعه مصنوعی مورد مطالعه قرار گیرد. روش یادگیری پیشنهاد شده در پژوهش برای افزایش دامنه توانایی‌های عامل‌ها، یادگیری تقویتی4 بود. با استفاده از این روش، عامل‌ها به مرور زمان یاد گرفتند که چگونه در مواجهه با شرایط مختلف محیطی، رفتارهای مناسب‌تری را انتخاب و اجرا کنند تا به اهداف فردی و اجتماعی نزدیک‌تر شوند. نتایج حاصل از شبیه‌سازی و انجام آزمایش‌ها نشان داد که اِعمال فرآیند یادگیری می‌تواند منجر به بهبود رفتار عامل‌ها و بهبود شاخص‌های رفاهی جامعه مصنوعی شود.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود عملکرد حمله در تیم ربات‌های فوتبالیست با استفاده از یادگیری تقویتی

به‌دلیل عدم امکان پیش‌بینی همه وضعیت‌های ممکن برای عامل‌ها در یک سیستم چندعامله‌ی پویا و گسترده، روش‌های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل‌ها می‌باشد. فوتبال شبیه‌سازی شده ربات‌ها یک مسئله شناخته‌شده برای ارزیابی الگوریتم‌های یادگیری ماشین روی سیستم‌های چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتم‌های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم رب...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

پیش‌بینی روند حرکتی قیمت سهام با استفاده از XCS مبتنی بر الگوریتم ژنتیک و یادگیری تقویتی

پیشرفت‌ها در حوزۀ هوش مصنوعی و یادگیری ماشین به‌خصوص درزمینۀ محاسبات تکاملی نه‌تنها ما را قادر به تجزیه‌وتحلیل مؤثرتر داده‌ها نموده است، بلکه این امکان را فراهم ساخته که از آن‌ها برای فهم هرگونه الگوی زیربنایی بازارهای مالی استفاده گردد. اقتصاددانان، آماردانان و مدرسان امور مالی همواره علاقه‌مند به توسعه و آزمایش مدل‌های رفتاری قیمت سهام بوده‌اند. XCS سامانه‌ای مرکب از الگوریتم ژنتیک و یادگیری ...

متن کامل

تنظیم خودکار سختی بازی‌های توان‌بخشی با استفاده از روش یادگیری تقویتی چندتناوبی (یاقوت)

تحقیقات نشان داده است که طراحی فعالیت‌های توان‌بخشی در قالب بازی‌های جدی می‌تواند منجر به انگیزش بیش‌تر در بیماران شود. درجه سختی چنین بازی‌هایی معمولاً به‌صورت دستی توسط درمانگر تنظیم می‌شود. این در حالی است که بازی‌های توان‌بخشی خانگی نیاز به تنظیم خودکار درجه سختی متناسب با مهارت‌های بیماران دارند. این مقاله روشی برای تنظیم درجه سختی بازی‌های توان‌بخشی ارائه می‌کند که در آن سختی بازی به‌صورت ...

متن کامل

تقریب تابع ارزش عمل با استفاده از شبکه توابع پایه شعاعی برای یادگیری تقویتی

مشکل تنگنای ابعاد، یکی از چالش هایی است که کاربرد الگوریتم های یادگیری تقویتی گسسته را در مورد مسائل کنترلی واقعی که دارای فضای حالت و عمل بزرگ و یا پیوسته می باشند محدود نموده است. ترکیب روش های آموزشی گسسته با تقریب زننده های تابعی برای حل این مشکل چندی است مورد توجه محققان قرارگرفته است. در همین راستا در این مقاله یک الگوریتم جدید یادگیری تقویتی عصبی (NRL) بر مبنای معماری نقاد- تنها معرف...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 8  شماره 29

صفحات  107- 125

تاریخ انتشار 2016-02-20

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023